home *** CD-ROM | disk | FTP | other *** search
/ Collection of Internet / Collection of Internet.iso / infosrvr / doc / www_talk.arc / 000277_masinter@parc.xerox.com _Sat Oct 31 00:44:11 1992.msg < prev    next >
Internet Message Format  |  1992-11-30  |  6KB

  1. Return-Path: <masinter@parc.xerox.com>
  2. Received: from dxmint.cern.ch by  nxoc01.cern.ch  (NeXT-1.0 (From Sendmail 5.52)/NeXT-2.0)
  3.     id AA28270; Sat, 31 Oct 92 00:44:11 MET
  4. Received: by dxmint.cern.ch (dxcern) (5.57/3.14)
  5.     id AA14947; Sat, 31 Oct 92 00:56:18 +0100
  6. Received: from poplar.parc.xerox.com ([13.2.16.165]) by alpha.xerox.com with SMTP id <11807>; Fri, 30 Oct 1992 15:55:23 PST
  7. Received: by poplar.parc.xerox.com id <101795>; Fri, 30 Oct 1992 15:55:08 -0800
  8. To: NED@sigurd.innosoft.com, nsb@thumper.bellcore.com,
  9.         wais-talk@quake.think.com, connolly@pixel.convex.com,
  10.         www-talk@nxoc01.cern.ch, ned@sigurd.innosoft.com
  11. In-Reply-To: Ned Freed's message of Thu, 29 Oct 1992 08:53:10 -0800 <01GQIM2YWA8I91VWYH@SIGURD.INNOSOFT.COM>
  12. Subject: Re: misconceptions about MIME [long]
  13. From: Larry Masinter <masinter@parc.xerox.com>
  14. Sender: Larry Masinter <masinter@parc.xerox.com>
  15. Fake-Sender: masinter@parc.xerox.com
  16. Message-Id: <92Oct30.155508pst.101795@poplar.parc.xerox.com>
  17. Date:     Fri, 30 Oct 1992 15:54:56 PST
  18.  
  19. >> The arguments that in-band designation of document format is better
  20. >> than out-of-band information may apply in the electronic mail
  21. >> scenarios, where there is a single sender, multiple recipients, and
  22. >> the recipient has no control over what the sender might send.
  23.  
  24. >The argument is identical for most file servers, which have even less control
  25. >over the specifics of what files they offer for retrieval. File servers usually
  26. >rely on contributed material and only rarely have anything resembling precise
  27. >control over the material they offer.
  28.  
  29. But we are not discussing 'file servers' in general, but something
  30. more specific and presumably over which we have more control: use of
  31. MIME content identifiers to identify content-type in World-Wide-Web
  32. and WAIS servers. Even in the case of file servers, while you might
  33. not have control over the material offered, you do have control over
  34. the description of that material as to which version of a purported
  35. standard format the material might be in, and even, in some cases,
  36. which profile of that standard might apply.
  37.  
  38. >> If I wish to retrieve the document, say to view it, I might want to
  39. >> choose the available representation that is most appropriate for my
  40. >> purpose. Imagine my dismay to retrieve a 50 megabyte postscript file
  41. >> from an anonymous FTP archive, only to discover that it is in the
  42. >> newly announced Postscript level 4 format, or to try to edit it only
  43. >> to discover that it is in the (upwardly compatible but not parsable by
  44. >> my client) version 44 of Rich Text. In each case, the appropriateness
  45. >> of alternate sources and representations of a document would depend on
  46. >> information that is currently only available in-band.
  47.  
  48. >Even if this happens (I have strong doubts that it will since documents made
  49. >available for public retrieval tend to converge rapidly to lowest-common
  50. >denominator usage) you have failed to propose an alternative that solves this
  51. >usefully.
  52.  
  53. Documents made available for public retrieval do not cannot 'tend to
  54. converge rapidly to lowest-common denominator usage', because *old
  55. documents do not go away*! If there is diversity today in the
  56. available formats for RFCs, tech reports and PhD theses, that
  57. diversity can only get worse! It is foolish to think that the
  58. diversity will diminish any time in the near future; certainly the
  59. number of 'conference proceedings on CD-rom' is increasing, as people
  60. want to share Mathematica documents, various forms of hypertext, audio
  61. content and the like.
  62.  
  63. As for a proposal that 'solves this usefully', I have a fairly mild
  64. proposal that, while it does not solve all of the problems in
  65. interoperability, does reduce the amount of uncertainty:
  66.  
  67. I propose (once again) that instead of saying 'application/postscript'
  68. it say, at a minimum, 'application/postscript 1985' vs
  69. 'application/postscript 1994' or whatever you would like to designate
  70. as a way to uniquely identify which edition of the Postscript
  71. reference manual you are talking about; instead of being identified as
  72. 'image/tiff' the files be identified as 'image/tiff 5.0 Class F' vs
  73. 'image/tiff 7.0 class QXB'.
  74.  
  75. > Finally, let me point out that I speak as one of the maintainers of one of the
  76. > largest archive of TeX material available anywhere. This material has been
  77. > available via MIME-compliant mail server (and of course FTP) for over six
  78. > months now. This archive contains hundreds of PostScript documents as well
  79. > as all sorts of other stuff. The problems you seem to think are endemic to
  80. > this sort of services have yet to materialize.
  81.  
  82. I think you need to take a longer-term and broader perspective than a
  83. six-month experience with a single representation of document.
  84.  
  85.  
  86. We've been developing a document archive service that can cope with 20
  87. years of collected electronic documents. We have not only Postscript 1
  88. and 2, but also several versions of Interpress, and Press format, two
  89. versions of DVI, revisable formats of 20 years of editor development
  90. -- several versions of tex, latex, framemaker, microsoft word, tioga,
  91. globalview, viewpoint, bravo, bravox, tedit, troff, interleaf,
  92. wordperfect, etc, and images in multiple variations of RES, AIS, TIFF,
  93. sun raster, pcx, macpaint, ad nauseum.
  94.  
  95. In trying to deal with a documents over the longer term, it has become
  96. apparent that merely marking documents with a simple 'format' tag like
  97. 'interpress' or 'postscript' or 'tiff' isn't adequate for most
  98. purposes. Standards evolve over as short as a 5 year period; even the
  99. method of internal tagging standard versions changes, and certainly,
  100. it is impossible to rely on in-band version information for all
  101. formats. 
  102.  
  103. I have more to say about the problem of 'external references' but I'll
  104. save that for another message.
  105.  
  106. It would be nice to have a calm discussion about possible solutions to
  107. these problems & hope you will forgo future sarcasm.
  108.  
  109. Thanks,
  110.  
  111. Larry